    Context and Keyword Extraction in Plain Text Using a Graph Representation

    Document indexation is an essential task achieved by archivists or automatic indexing tools. To retrieve relevant documents to a query, keywords describing this document have to be carefully chosen. Archivists have to find out the right topic of a document before starting to extract the keywords. For an archivist indexing specialized documents, experience plays an important role. But indexing documents on different topics is much harder. This article proposes an innovative method for an indexing support system. This system takes as input an ontology and a plain text document and provides as output contextualized keywords of the document. The method has been evaluated by exploiting Wikipedia's category links as a termino-ontological resources

    Modeling Human Interaction to Design a Human-Computer Dialog System

    This article presents the Cogni-CISMeF project, which aims at improving the health information search engine CISMeF, by including a conversational agent that interacts with the user in natural language. To study the cognitive processes involved during information search, a bottom-up methodology was adopted. An experiment has been set up to obtain human dialogs related to such searches. The analysis of these dialogs underlines the establishment of a common ground and accommodation effects to the user. A model of artificial agent is proposed, that guides the user by proposing examples, assistance and choices

    Modèle de comportement communicatif conventionnel pour un agent en interaction avec des humains (Approche par jeux de dialogue)

    Cette thèse a pour objectif l amélioration des capacités communicatives des agents logiciels en interaction avec des humains. Dans ce but, nous proposons une méthodologie basée sur l étude d un corpus d interactions Homme-Homme orientées vers la réalisation d une tâche. Nous proposons un cadre qui s appuie sur les jeux de dialogue afin de modéliser des motifs dialogiques observés. Nous illustrons la spécification de tels jeux depuis des motifs extraits en appliquant l'ensemble des étapes de noter méthodologie à un corpus. Les jeux spécifiés sont validés en montrant qu ils décrivent de façon appropriée les motifs apparaissant dans le corpus de référence. Enfin, nous montrons l intérêt interprétatif et génératif de notre modèle pour le fondement du comportement communicatif conventionnel d un agent interagissant avec un humain. Nous implémentons ce modèle dans le module Dogma, exploitable par un agent dans un dialogue impliquant deux interlocuteurs.This research work aims at improving the communicative behaviour of software agents interacting with humans. To this purpose, we present a data-driven methodology based on the study of a task oriented corpus consisting of Human-Human interactions. We present a framework to specify dialogue games from observed interaction patterns based on the notion of social commitments and conversational gameboard. We exemplify the specification of dialogue games by implementing all the steps of our methodology ona task-oriented corpus. The produced games are validated by showing that they appropriately describe the patterns appearing in a reference corpus. Eventually, we show that an agent can take advantage of our model to regulate its conventional communicative behaviour on both interpretative and generative levels. We implement this model into Dogma, a module that can be used by an agent to manage its communicative behaviour in a two-interlocutor dialogue.ROUEN-INSA Madrillet (765752301) / SudocSudocFranceF

    Conception d'un outil d'aide \`a l'indexation de ressources p\'edagogiques - Extraction automatique des th\'ematiques et des mots-clefs de documents UNIT

    Indexing learning documents using the Learning Object Metadata (LOM) is often carried out manually by archivists. Filling out the LOM fields is a long and difficult task, requiring a complete reading and a full knowledge on the topic dealt within the document. In this paper, we present an innovative model and method to assist the archivists in finding the important concepts and keywords of a learning document. The application is performed using wikipedia's category links

    Mieux gérer les communications au sein d'un groupe coopératif (les apports des outils de TAL et des SMA)

    Les acteurs d'une entreprise doivent collaborer efficacement pour atteindre les objectifs de l'entreprise, et ce dans un environnement évoluant en permanence, alors que les systèmes informatiques actuels sont pour la plupart construits sur la base d'analyses de l'organisation de l'entreprise et d'un recueil des besoins des utilisateurs à un moment donné. Or les médiations par lesquelles les acteurs d'un processus de conception vont échanger des informations, spécifier leurs tâches, se coordonner, évaluer l'activité sont les véritables objets qui doivent former la base des outils informatiques de support des activités coopératives de conception. Ces ajustements passent presque exclusivement par la communication et souvent suivant des circuits qui ne peuvent être définis à l'avance. En effet, les communications entre les acteurs de l'entreprise sont rarement prises en considération dans le système informatique, même dans les systèmes dits de travail coopératif, alors qu'il est notoire que ces communications véhiculent une part très importante de l'information de l'entreprise. Les méthodes et outils d'organisation du travail peuvent bénéficier des nouvelles technologies de la communication pour rendre ces adaptations plus efficaces. Un nouveau type d'outillage informatique devient alors nécessaire pour désambiguïser, faciliter, structurer, améliorer, augmenter, et permettre des recherches évoluées dans les échanges survenant entre les acteurs (humains et informatiques) d'un système sociotechnique coopératif. Les systèmes multi-agents, dynamiquement reconfigurables, peuvent suivre ces évolutions et prendre en compte les spécificités de chacun des acteurs. Nous proposons donc un système de médiation des communications et de gestion de mémoires d'entreprises, fondé sur une architecture multi-agent permettant un usage adapté aux activités "métier" des utilisateurs d'outils associés aux différents niveaux de traitement des langues (syntaxique, sémantique, pragmatique).The actors of a company must collaborate efficiently to achieve the common purposes of the company in an environment permanently evolving, while most current information processing systems are based on the analysis of the company's organization and on the collection of the user's needs at a given time. Whereas mediations, which permit actors' coordination, information exchanges, tasks' specifications and activity evaluation, would be real objects to conceive tools to support collaborative conception activities. This fits undergoes almost exclusively by communication and often following nonprescriptive circuits. Actually, the communications between actors of the company are seldom correctly taken into account in the information processing system. This occurs even in recent systems of collaborative work or of workflow management, whereas it is well known that these communications transmit a very significant part of the information circulating in the company. The methods and tools of work organization can benefit from new technologies of communication to return these more effective adaptations. A new type of software will be then necessary to disambiguate, to facilitate, to structure and to allow complex searches in the exchanges arising among the actors (human beings and software agents) of a cooperative socio-technical system. Multi-Agents Systems, dynamically adaptable, can follow this evolutions and take into account each actors' specificities. We thus propose a system of communication mediation and of memories companies management, based on a multi-agent architecture. This architecture allows a use adapted to the "professional" activities of tool users associated to the various levels of language processing (syntactic, semantic, pragmatic).ORSAY-PARIS 11-BU Sciences (914712101) / SudocSudocFranceF

    Designing a Human-Computer Dialog System for Medical Information Search

    International audienceThis article presents the Cogni-CISMeF project, which aims at improving medical information search in the CISMeF system by including a conversational agent to interact with the user in natural language. To study the cognitive processes involved during the information search, a bottom-up methodology was adopted. Experiments have been set up to obtain human dialogs dealing with medical information search. The analysis of these dialogs underlined the establishment of a common ground and accommodation effects to the user. A model of artificial agent is proposed. It leads the user in its information search by proposing to him examples, assistance and choices

    An Issue-Based Approach to Information Search Modelling: Analysis of a Human Dialog Corpus

    International audienceWe aim at improving the health information search engine CISMeF, by including a conversational agent that interacts with the user in natural language. To study the cognitive processes involved during information search, a bottom-up methodology was adopted. An experiment has been set up to obtain human dialogs related to such searches. In this article, the emphasis lays on the analysis of these human dialogs

    Méthodologie pour l'orchestration sémantique de services, application au traitement de documents multimédia

    Après un état de l'art complet nous avons détaillé notre approche de services sémantiques utilisant une méthode innovante pour la composition de services, les patrons de chaînes de traitements. Notre approche est constituée d'un annuaire sémantique hybride proposant différents niveaux de correspondances entre services, de règles de compositions automatiques dans le cas où une demande de services n'est pas fructueuse et enfin d'un moteur d'exécution supportant la résolution et la composition dynamique de services. Par la suite nous avons défini une méthodologie innovante, basée sur l'utilisation de taxonomies de services permettant de peupler rapidement un annuaire sémantique de services. Pour ce faire, nous avons mis au point une ontologie de haut niveau qui permet de lier la classe d'une taxonomie avec un service abstrait annoté sémantiquement. Enfin, nous avons évalué notre prototype à partir des chaînes de traitement mises en place dans les plate-formes déployées par Cassidian.After a complete state of the art we detailed our semantic services approach which uses an innovative method for services composition: processing chains patterns. Our approach is composed on an hybrid semantic servicers registry which propose different levels of matching between services, some composition rules when the matching phase failde and an execution engine which is able to dynamically resolve and com^pose services. In order to solve the service regitry population issue, we have designed an upper ontology, which enables links between a service taxonomy class with a semantically annotated abstract service. Finally, we have evaluated our prototype using real processing chains used by Cassidian platforms.ROUEN-INSA Madrillet (765752301) / SudocSudocFranceF

    VIZDeL : Visualiser pour exporter

    National audienceMalgré l'existence d'un grand nombre de ressources termino-ontologiques (RTO), leur granularité se révèle mal adaptée à la réutilisation prévue. De nombreux travaux abordent l'adéquation d'une RTO à une application principalement du point de vue de sa construction, à partir de texte ou par alignement/fusion d'autres RTO. Dans une perspective de réutilisation de RTO existantes, nous proposons ici un outil qui permet à un utilisateur de constituer sa RTO par sélection des informations nécessaires via un outil de visualisation, puis de les exporter sous un format standard pour constituer un réseau adapté. Cet article présente VIZDeL, un outil de visualisation de RTO, puis VOWdeL, un outil d'export d'ontologie OWL sur mesure